
牛新庄
中国邮政储蓄银行党委委员、副行长、首席信息官
尊敬的各位领导,下午好!很荣幸受邀参会,我分享的主题是“激发数据要素潜能,共筑数字金融新生态”。
每个时代都具有以技术特征标注的“生产要素”:土地与劳力标注了农业文明;钢铁与蒸汽标注了工业文明;如今,数据与算力标注了智能时代。“数据”不再只是人类社会的记录和展现,它成为了智能时代最核心的生产要素,正以前所未有的深度与广度,驱动并重构社会经济的一切价值逻辑。
邮储银行围绕“激发数据要素潜能”这一重要性和决定性的时代命题进行了前瞻性的探索和实践——以管好数据资产为基石,以用好数据资产为引擎,以创新数据资产为突破,搭建三级闭环体系,并进一步构建“快、准、全、易、智”五大支柱,全面盘活海量数据,推动数据资源向高价值资产跨越,为共筑数字金融新生态贡献邮储智慧与实践。
下面,我主要从“技术演进、邮储实践、未来展望”三个方面进行分享交流。
一、技术演进:以“记录-资源-资产”实现四次价值跃迁
(一)政策要求深化:从管理规范到价值发挥
“五篇大文章”为我国金融服务实体经济指明了大方向,中央经济工作会议提出“科技自立自强”,进一步凸显了数据要素在科技革命中的重要价值。近几年,国家层面围绕数据要素与数字金融的顶层设计日趋完善,政策导向已从“建制度规范”向“促价值释放”转变,政策体系日趋完善。
一是体系搭建期,健全全域管理体系。2019年10月,中共中央《中国共产党第十九届中央委员会第四次全体会议公报》首次将数据明确纳入生产要素。2022年12月,国务院发布《关于构建数据基础制度更好发挥数据要素作用的意见》(又称“数据二十条”),从数据产权、流通交易、收益分配、安全治理四方面初步形成我国数据基础制度的“四梁八柱”,提出20条政策举措。
二是作用凸显期,构建人工智能底座。2023年12月,国家数据局等十七个部门联合发布《“数据要素×”三年行动计划(2024—2026年)》,强调以科学数据支持大模型开发,构建科学知识资源底座,建设高质量语料库和基础科学数据集,支持开展人工智能大模型开发和训练。2024年12月,国家数据局等部门发布《关于促进企业数据资源开发利用的意见》,指出要引导企业加快向数据驱动的经营模式转型,通过多源数据整合分析、打通全链条数据、运用数字技术等方式,提升洞察市场和适应市场的能力。
三是价值释放期,贯穿经营创新全程。2025年3月,国务院办公厅发布《关于做好金融“五篇大文章”的指导意见》,强调依法合规推进金融数据共享和流通,通过数字技术赋能经营决策、资源配置、业务改造、风险管理、产品研发等各环节,提升数字化经营服务能力。2025年8月,国务院发布《关于深入实施“人工智能+”行动的意见》,提出加快实施“人工智能+”科学技术、“人工智能+”产业发展等6大重点行动,提升模型基础能力、加强数据供给创新等8项基础支撑能力。2025年8月,国家数据局发布《高质量数据集建设指引》,提出高质量数据集建设“1+1”的参考路径,指导推进高质量数据集建设,助力人工智能纵深发展。
这一系列紧密衔接、层层递进的政策布局,推动了数据效用的迭代升级、走深走实,对金融机构也产生了深远而具体的影响。首先,以全域视角健全数据管理体系,规范全过程、全领域、全场景、全覆盖的金融数据综合管理与应用能力,提升数据供给与交付效率。其次,驱动人工智能在更广范围、更深层次上与具体应用场景结合,着力打造高质量数据集,研发数据场景智能体。再次,必须在发展中统筹数据有序流通与安全可控,通过技术、制度与生态的协同,将数据安全贯穿数据要素价值创造的全过程。
(二)效能演进升级:从孤点记录到织网生态
在新的政策背景下,数据已从记录载体逐步演变为驱动业务发展、重构金融生态的战略资产。纵观从电子化、信息化到数字化、数智化的技术演进路径,其本质是数据价值的深化认识和价值跃迁——数据从单纯记录、点状孤立存在,逐步发展为彼此连接、织网生态驱动的核心战略资产。犹如一场从配角到主角的身份转变,数据已完成从辅助资源到核心要素的价值跃迁,成为驱动金融未来发展的“关键引擎”。
具体演进历程可归纳为四个阶段:
第一阶段:电子化——从模拟到数字的“记录革命”。
电子化阶段的本质是从模拟到数字,解决“有无”问题。从数据使用特征来看,广度上是单点、单业务环节的使用;深度上是静态的记录与存储,替代纸质介质;从资产化状态来看,数据作为“记录”,是成本中心,主要价值在于提升局部效率。
第二阶段:信息化——从数字到连接的“流程赋能”。
信息化阶段的本质是从数字到连接,解决“流程”问题。从数据使用特征来看,广度上实现跨部门、跨系统的流动,支撑核心业务流程;深度上实现查询、统计与流程管控,支持管理决策;从资产化状态来看,数据作为“资源”,是管理要素,价值体现在流程优化与内部控制。
第三阶段:数字化——从连接到重构的“模式创新”。
数字化阶段的本质是从连接到重构,解决“业务模式”问题。从数据使用特征来看,广度上覆盖全渠道、全链路、全生态,驱动业务创新;深度上成为客户洞察、产品迭代、市场响应的核心生产资料;从资产化状态来看,数据成为“潜在资产”,是价值创造源泉,直接关联收入增长与客户体验提升,亟待估值与资本化。
第四阶段:数智化——从重构到赋能的“智能跃迁”。
数智化阶段的本质是从重构到赋能,解决“智慧与自主”问题。从数据使用特征来看,广度上达到内外部数据深度融合,构建智能生态;深度上通过AI模型实现智能预测、自动决策与自适应优化;从资产化状态来看,数据成为“核心生产性资产”,构建战略级竞争力,可独立产生价值,进入可交易、可计价的资产运营阶段。
这四个阶段的演进并非简单的工具升级,而是数据价值本质上的深刻变革,标志着数据从信息系统底层的“二进制代码”,演变为可度量、可驱动,并具有业务关联性和经济价值性的“战略资产”。
计算机的根本原理基于二进制运算,8个bit构成1个字节,1024个字节为1KB,从bit到Byte,再到Data,成为Knowledge,最终沉淀为战略资产。如果将其转换成文字描述,我们可以这样理解数据的价值跃迁之路:它始于最基本的计算单位,不断汇聚成为有意义的信息单元,进一步组织为可被解读的数据,后被提炼为支撑决策的知识,最终沉淀为可产生持续回报的核心资产。
近年来,大模型技术发展迅猛,邮储银行已构建了300多个大模型应用场景。我们在大模型的运用过程中深刻感受到,一切大模型的应用,都起始于扎实的数据资产;一切大模型的好用,也终将归结于丰富的数据资产。如果没有清晰的数据治理和标注,所有的场景应用将无从谈起。如果说大模型类似于精密的“模具”,那么数据就是最基础的“原材料”,原材料不合格,模具再好也无法产出合格的产品,也就是业界常说的数据投毒问题。因此,在拥抱大模型的同时,筑牢数据资产的品质基础,比以往任何时候都更为关键和必要。
二、邮储实践:以“好用-易用-智用”搭建三级闭环体系
数据资产化是企业将数据资源转化为战略资产的系统工程。邮储银行构建了一个价值持续循环、效能不断提升的良性闭环体系,包含“管理-使用-创新”三个核心层级:以数据资产管理为根基,让数据“更好用”;以数据资产使用为引擎,让数据“更易用”;以数据资产创新为突破,让数据“更智用”。邮储银行的数据资产化实践以组织文化、制度体系、技术支撑和敏捷团队等保障体系为底座,在此基础上实现三个环节的层层递进,并构建“快、准、全、易、智”五大支柱,旨在盘活存量数据资源、推动数据资源资产化,最终完成数据从静态成本到动态资产的战略性跨越。
(一)以数据资产管理为根基,让数据“更好用”
数据资产化的前提是具备高质量、高时效、全域化的“原材料”。邮储银行搭建“快、准、全”三大支柱,重塑数据资产管理体系,奠定数据资产化的价值转化基础。
第一支柱:以“快”制胜,自研信创架构,提升数据处理效能
邮储银行自研适配信创环境的大数据产品UDZ,采用“Hadoop+MPP”协同架构持续向一体化架构演进升级。运用流式技术构建实时数仓,通过数据湖技术实现流批数据融合,初步构建了湖仓一体、流批一体的架构,提供“批量+微批+实时”多时效数据服务模式,奠定数据资产化基础。
在数据处理方面,每日处理实时、准实时数据超50亿条,覆盖个人存款、贵金属交易等17个核心业务系统,聚焦风险防控、精准营销、实时大屏、绩效管理四大关键领域,建设183个准实时业务场景,为总分行提供持续、稳定的实时数据加工与传输服务,全面赋能业务决策与运营管理。同时,每日处理数据量约300TB,完成超25万个批量作业,处理6.7亿条客户数据、18亿个账户数据,高效支撑监管报送、风险管理、经营分析、营销建模等场景。
在产品研发方面,自主研发数据库、大数据Hadoop生态产品,建设标准化组件替换原有开源HDP版本,在全行推广产品应用,加速邮储银行国产化自主可控进程。
第二支柱:以“准”立本,强化数据治理,输出优质数据资产
资产的价值根植于可信度,邮储银行不断强化数据治理,通过输出高质量数据资产,为上层应用构建了准确可信的数据基础。
前期,邮储银行的数据治理基础较为薄弱,曾经出现一个客户用自己名字开通多个账户的情况。面对复杂的数据治理挑战,邮储银行深刻认识到缺乏治理的数据不是资产,而是风险。为此,我们构建了覆盖数据全生命周期的数据质量管理机制,以“主动预防、精准治理”为核心,采取刚性管控、流转校验、智能监测与常态化检核相结合等措施,持续输出准确、可靠、高效的数据资产,为深化数据应用、赋能业务创新和落实全行数智化战略奠定了坚实基础。
第三支柱:以“全”拓界,盘活存量资源,发布全域数据资产
真正的数据资产需突破内部孤岛。邮储银行通过存量数据全域融合,对内完成数字资产盘点,对外融合多领域数据,打通内外部数据疆界,构建了全域数据资产视图,激活数据生态潜能。
从整体实践看,邮储银行打造了数据资产管理与运营“两大支柱”,践行系统、安全、制度“三大保障”,提供“四类资产”,聚焦“四大视角”,为用户输出“五大服务”,输出客户、渠道、产品、风险、运营等“N项赋能”。此外,2022-2025年连续4年发布《中国邮政储蓄银行数据资产白皮书》,持续探索数据资产价值发挥机制,助力全行数据资产的高效应用。
(二)以数据资产使用为引擎,让数据“更易用”
数据资产管理是为了实现服务价值的转化。邮储银行致力于将数据能力无缝注入各业务环节,构建了全流程的数据资产管理与应用体系,以平台为底座,以工具为支撑,提供高效便捷的数智服务,强化数据在客户服务、科创金融、资金预测等领域的赋能,让数智化服务更“易用”,不断驱动业务增长。
第四支柱:以“易”为纲,实现易用目标,提供高效便捷服务
在平台化支撑方面,打造了集管理与运营于一体的数据资产管理平台,通过“管好数+用好数”的协同驱动模式支撑业务发展需求。
在工具化赋能方面,通过数据实验室、模型管理等系统,协同提供数据加工、分析挖掘、模型管理等服务,目前已累计开发一万余个规则、算法类模型,应用于客户分析、营销管理、风险监控等业务领域。
在服务化输出方面,提供了三种服务。一是API服务,依托标准化接口驱动业务流程优化。深度嵌入信用卡、贷款、营销等核心业务流程,实现毫秒级响应,已提供2100余项服务。二是报表服务,通过“AI+BI”融合降低智能洞察门槛。提升报表便捷与灵活性,实现数据服务自助化、智能化。三是图谱服务,运用图数据、特征库、场景库实现一体化应用模式,提升客户洞察能力。挖掘特征超1000个,支撑20余个业务应用场景。
在价值化赋能方面,涵盖了三个层面。一是建体系、强赋能,以智能营销精准匹配产品服务。采用“大数据+大模型”构建零售智能营销框架,服务理财客户5400万户,助力新增财富客户超15万户,理财销量超400亿元;经营性贷款信贷投放超100亿元,基于模型筛选的用户总授信约59亿元,支用金额超17亿元,真正实现了数据驱动信贷精准投放。二是建图谱、促复用,以产业链知识图谱赋能对公业务发展。聚焦航天、兵器、钢铁等重点产业链,采用“图谱+规则”、机器学习、图神经网络等方法开展潜客挖掘及产品推荐,“小企业产业链拓客模型”等数据分析项目带来新开户3300余个,授信金额近500亿元。三是开新局、提能力,以模型驱动科学管理与决策。比如,建立财务预算模型,预测精度提升超50%;建立流动性管理深度学习预测模型,变“被动响应”为“主动预测”,超储日均压降37亿元(降幅20%),为银行增厚收益超970万元。
(三)以数据资产创新为突破,让数据“更智用”
在夯实数据资产管理基石、构建数据资产使用引擎的基础上,邮储银行以数据资产创新为突破,拓宽挖深应用场景,让数据自身“会思考、能流动、可增值”,从而开拓价值创造新范式。
第五支柱:以“智”革新,构建应用场景,驱动业务创新发展
一是打造高质量金融数据集体系。邮储银行以行内结构化和非结构化数据为主要数据来源,融合外部数据,打造层次清晰、数智融合、可持续运营的高质量金融数据集体系,实现从结构化数据到全模态数据要素的运营模式转变。基于“通识-行业-企业-领域-场景”五层数据集架构,通过“采、建、管、用”四大标准工艺,实现全行内外部数据的灵活应用。
二是构建智能化数据工程能力。从国家战略和行业发展趋势来看,“数据要素×”行动明确要求激活数据价值,大模型正是释放银行海量数据资产价值,实现从“数据多”到“数据强”的核心转换器。邮储银行主动拥抱大模型技术,聚焦“AI for Data”,围绕数据“研发、流转、安全、治理”四大核心工作,构建基于大模型的数据智能化能力,实现从“人工驱动”到“智能内生”的重构,助力数据资产“管、用、治”的全链路高效闭环。数据研发方面,自主研发基于模式链接、自主纠错的NL2SQL智能体,具备SQL生成、分析、优化和解读等功能,可实现分钟级生成,生成准确率达80%以上。数据流转方面,自主研发基于控制思维链和大小模型融合的数据血缘智能体,具备智能血缘图谱、问题快速排查、冷热数据识别和数据确权认责等功能,精准、动态追溯数据流转,覆盖超600万字段,实现分钟级查询响应。数据安全方面,自主构建高质量语料集,自主研发基于编码器和解码器架构的分类分级大模型,具备批量分类分级、实时分类分级等功能,实现数据安全分类分级准确率业界领先。数据治理方面,自主研发基于大模型的相似性判断和关联分析能力,具备智能定标、智能贯标、智能检查和智能评估等功能,打造智慧数据治理助手,实现治理效率与准确性双提升。
在新技术应用的同时,数据部门的使命也在悄然转变。许多银行的数据管理部门认为,他们的职责就是管理数据,强调数据安全,但数据真正的价值不在于将数据“管起来”,而在于让数据“活起来”,使之驱动业务运营和场景创新。比如手机银行预约转账服务,邮储银行通过后台数据查询显示,有38万个客户会在每月固定日期进行转账操作,客户的真实所需就是功能的建设初衷,我们第一时间建立了预约转账功能并定向推送给这些有需要的客户;再比如短信推广方式,有很多客户习惯性不看或拒收短信,导致很多短信推广实际上是无效的,我们通过内部数据查询定位客户倾向,对于不接受短信方式的客户不再推送,每年可为邮储节省几千万短信费用。
三是探索大模型应用场景。当前银行业普遍存在两大痛点,一是业务人员不懂代码,且受限于高技术门槛和复杂的业务逻辑,取数效率低,同时缺乏智能取数工具,阻碍了数据资产价值释放;二是数据分析依赖专业人员,无法快速响应且缺乏智能分析工具,难以根据数据变化自动进行重点洞悉。为了解决上述问题,邮储银行参考豆包和DeepSeek模式开发了“智能问数”产品。区别于豆包基于社会综合性数据的特点,邮储银行“智能问数”服务主要聚焦于行内数据,自主调优Deepseek- R1模型,不依赖第三方BI工具,自研AI原生的“边想边算”能力及多智能体技术,并通过自然语言交互方式,实现查询数据、绘图制表、生成报告等核心功能,将以往需要几天达成的数据提取和分析任务缩短为分钟内完成,极大增强了经营管理者的分析和决策效率,显著提升了数据的易用性体验和智能化水平。使用人员仅需通过对话框询问所需数据,大模型即可自动给出结果。目前“智能问数”服务已覆盖用户2万余人,问数结果采纳率超95%,可提供2000余个业务指标,报告生成和问数响应时间均小于3分钟。
三、未来展望:以“管理-使用-创新”推动三层转化路径
未来,邮储银行将全面拥抱AI,通过智能技术不断完善数据治理、深度挖掘数据价值、持续强化数据驱动能力。通过构建“管理-使用-创新”三层转化路径,让智能技术贯穿数据资产管理、使用与创新的全价值链条,为高质量发展注入新动能。
在数据资产管理方面,打造全生命周期的“智能体系”。聚焦“AI for Data”,邮储银行将以AI为核心引擎,深度赋能数据资产的全生命周期管理,构建智能化的数据资产管理体系。通过AI技术实现质量规则的自动识别、实时监测与智能溯源。并基于大模型实现数据资产的自动盘点、打标与链路分析,覆盖数据“采、管、建、用、退”全生命周期。并在提升治理效率的同时,筑牢安全与合规防线。
在数据资产使用方面,探索数据深层价值的“智能服务”。邮储银行将借助AI驱动的分析工具与智能应用平台,挖掘数据深层价值,支持决策创新与业务赋能。通过构建数据智能体(Data Agents),打造体系化、平台化、通用化的数据智能服务能力,促进多元业务场景提质增效。积极应用大模型赋能业务发展和经营管理,探索研究智能管家、数字分身等方式,进一步提升经营管理效率。
在数据资产创新方面,开拓数据生产要素的“智能边界”。邮储银行积极探索以数据为核心生成要素的经营模式,利用生成式AI、机器学习等技术,持续激发数据潜能,开发数据产品与服务,推动数据从资源到资产、从资产到价值实现的实质性跨越。尤其是在构建高质量数据集方面,通过AI助力工具链能力提升,实现智能、自动标注,提供数据工程工具链能力。
2025年12月10日,邮储银行正式发布“AI2ALL”智能生态,标志着邮储银行已进入全面拥抱人工智能的崭新时代。我们深刻认识到,人工智能不仅仅是技术的跃升,更是对企业经营模式、业务流程、文化理念与价值体系的全面重塑,它推动的不再是单点突破,而是业务与技术深度融合、共同演进的一场系统性重构。在这场深刻的变革进程中,高质量的数据资产扮演着不可或缺的双重角色——它既是支撑银行智能体系稳健运行的基石,也是驱动业务价值持续增长的燃料。站在“数据”为关键生产要素的新时代,邮储银行将持续激发数据要素潜能,不断深化数据资产化实践,朝着共筑数字金融新生态的方向持续迈进!